Chatbot RAG con LangChain, Firebase y Pinecone
Guía práctica para construir un chatbot RAG con LangChain, Firebase y Pinecone: extracción, particionado, embeddings y búsqueda semántica, con buenas prácticas y apoyo de Q2BSTUDIO.
Guía práctica para construir un chatbot RAG con LangChain, Firebase y Pinecone: extracción, particionado, embeddings y búsqueda semántica, con buenas prácticas y apoyo de Q2BSTUDIO.
Convierte libros históricos en grafos de conocimiento en SurrealDB: extracción de PDFs, análisis de sentimiento y relaciones entre países, con consultas y visualización de tendencias.
Descubre Kreuzberg, framework Python para extraer texto, metadatos e información estructurada de PDFs, imágenes y documentos Office, con OCR y API unificada.
Convierte capturas PNG a PDF en Linux con OCR usando Tesseract y Pandoc: guía de instalación, comandos básicos y un script rápido para extraer texto y generar PDFs.
Descubre cómo diseñar un servidor de PDFs con FastMCP: arquitectura modular, extracción de texto y metadatos, conversión y seguridad para automatizar facturas y BI
Descubre un servidor MCP para PDFs basado en FastMCP con arquitectura Service-Tool-Registration. Ofrece extracción de texto y metadatos, manipulación y conversión de PDFs, y automatización guiada por IA. Diseño orientado a producción, pruebas, manejo de errores y despliegue seguro en la nube.
Granite Docling es la solución multimodal de IBM Research para convertir imágenes de documentos en texto estructurado y editable, preservando tablas y diseño, compatible con Docling y flujos RAG.
Descubre el backend que transforma PDFs en embeddings y genera un índice FAISS para búsqueda semántica en el chatbot RAG Indaba, junto a Q2BSTUDIO.
Procesa PDFs en docs, extrae texto, genera fragmentos con solapamiento, crea embeddings con all-MiniLM-L6-v2 y un índice FAISS; guarda faiss_index.bin y chunks.pkl para búsquedas por similitud y chatbots RAG.